ViewSAM: Aprendizaje de semántica cruzada multimodal consciente de la vista para el seguimiento multiobjeto referencial entre vistas con supervisión débil
ViewSAM emplea aprendizaje multimodal y supervisión débil para el seguimiento multiobjeto entre vistas, logrando alta precisión sin anotaciones costosas.